import requests
from lxml import etree
'''

xpath练习：

使用requests和xpath对数据进行抓取

目标网站：https://www.mmonly.cc/抓取图片信息

要求展示信息：href链接地址，src图片地址，图片名；

保存要求：创建表并保存数据，只需要保存一页数据即可

提交方式：代码截图（包含学生名），数据库数据截图，完整代码文件
'''
#需要抓取的链接网址
url = 'https://www.mmonly.cc/'
#伪装头
header = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36"}
#拼接头和身体
r = requests.get(url,headers=header)
# print(r.text)
#转码
r.encoding='utf-8'
html = etree.HTML(r.text)
# print(html)
#获取tr，利用xpath通过class属性定位table标签，获取子标签tbody在获取tbody下，子标签tr
# i = html.xpath('//li/div[@class="picbox"]')
title=html.xpath('//div[@class="item masonry_brick masonry-brick"]/ul[@class="mb7"]/div[@class="img"]/div[@class="ABox"]')
# print(title)
#利用for循环抓取tr标签内目标内容
for im in title:
    # print(im)
    #通过tr标签获取子标签td内目标内
    src_ = im.xpath('./img[@width="234"]/@src')
    # herf_ = im.xpath('./@herf')
    # nsme_ = im.xpath('./p[@class="name"]')
    print(src_)
#定义td标签内容，strip去空格
# ipinfo = tds[0].strip()
# portinfo = tds[1].strip()
# print(ipinfo,portinfo)